ارائه یک مدل دوهدفه برای خوشه بندی داده ها با تمرکز بر تعیین تعداد خوشه های مناسب

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه بوعلی سینا - دانشکده فنی و مهندسی
  • نویسنده مهدی خالقی
  • استاد راهنما رامین صادقیان
  • سال انتشار 1391
چکیده

در این تحیق مسأله خوشه بندی یک مجموعه داده، به صورت یک مسأله بهینه سازی دوهدفه که دو هدف را به صورت همزمان بهینه می کند، مطرح شده است. این تکنیک خوشه بندی دوهدفه از روش بهینه سازی چند هدفه سلسله مراتبی شبیه سازی تبرید به عنوان استراتژی بهینه سازی استفاده می کند. برای توابع هدف خوشه بندی، ما سعی در انتخاب معیارهای بهینه سازی داریم که به صورت اساسی جنبه های مختلف یک جواب خوب خوشه بندی را منعکس کند. برای این کار ما از دو تابع هدف مکمل یک دیگر استفاده می کنیم که یکی بر پایه تراکم خوشه ها و دیگری بر پایه اتصال خوشه ها می باشد و این دو تابع هدف برای تعیین تعداد مناسب خوشه ها در مجموعه داده به صورت همزمان بهینه می شوند. بنابراین تکنیک خوشه بندی مطرح شده قادر به شناسایی تعداد مناسب خوشه ها و افراز مناسب داده ها در انواع مجموعه داده های مختلف می باشد. یک روش نیمه نظارتی نیز برای انتخاب یک جواب از میان جواب های بهینه موثر پارتوی تکنیک خوشه بندی دوهدفه مطرح شده نیز ارائه می شود که با استفاده از امتیاز مینکوفسکی به انتخاب بهترین جواب و تعیین تعداد خوشه ها می پردازد. کارایی الگوریتم برای دو مجموعه داده مصنوعی و نیز شش مجموعه داده واقعی با پیچیدگی های مختلف نشان داده شده است. نتایج همچنین با تکنیک های خوشه بندی چندهدفه دیگر از قبیل mock، mops، دو تکنیک خوشه بندی یک هدفه بر پایه الگوریتم ژنتیک و تکنیک اتصال میانگین مقایسه شده اند.

منابع مشابه

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

نحوه خوشه بندی آماری داده های شکل

اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...

متن کامل

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

خوشه بندی یکی از تکنیک های اصلی داده کاوی است. خوشه بندی فرایندی است که مجموعه داده ها را داخل گروه هایی طبقه بندی می کند. در خوشه بندی داده های موجود در یک خوشه بیشترین شباهت را به هم دارند و داده های موجود در دو خوشه متفاوت بیشترین تفاوت را با هم دارند. الگوریتم های خوشه بندی با توجه به نوع داده ها به دو دسته تقسیم می شوند: الگوریتم های خوشه بندی داده های عددی و الگوریتم های خوشه بندی داده ها...

متن کامل

خوشه بندی خودرو سازان بر اساس تابع تولید اقتصادی با استفاده از تحلیل پوششی داده ها

  خوشه بندی به کمک تحلیل پوششی داده ها(DEA) شناسایی روابط پنهان بین عوامل ورودی و خورجی واحدهای تصمیم گیری در تعیین تابع تولید آنهاست.در این مقاله به کمک خوشه بندی بر اساسDEA توابع تولید واحدهای تصمیم گیری صنایع خودرو سازی(از جمله سایپا) به صورت تفکیک شده مشخص می شود.تعیین توابع تولید خودروسازان و استفاده از انها در تفکیک صنایع مشابه با قابلیت در نظر گرفتن همزمان چندین عامل ورودی و خروجی از مز...

متن کامل

ارائه مدل تحلیل خوشه بندی خاکستری در ارزیابی عملکرد و رتبه بندی هیات های ورزشی

هدف از پژوهش حاضر ارائه مدل تحلیل خوشه بندی خاکستری در ارزیابی عملکرد و رتبه بندی هیات های ورزشی بود. محدوده مورد مطالعه استان اصفهان؛ و نمونه آماری را هیات های ورزشی با ویژگی رشته های دسته جمعی و توپی شامل هیات های ورزشی فوتبال، والیبال، هندبال، بسکتبال، راگبی، و بیس بال (و سافت بال) تشکیل دادند که بر اساس چهار مولفه اصلی توسعه سخت افزاری (3 شاخص)، توسعه ورزش همگانی (5 شاخص)، توسعه ورزش قهرمان...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه بوعلی سینا - دانشکده فنی و مهندسی

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023